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Description 

Structural phosphoprotein (pp 28) of human cytomegalo- 
5 virus (HCMV) , the preparation and use thereof 

The invention relates to a structural HCMV phosphoprotein 
of 28 kD (pp28) and immunogenic parts thereof, to the 
preparation thereof by genetic manipulation, and to the 
use thereof as a diagnostic aid and for producing anti- 
10 bodies and vaccines. 

To date, HCMV polypeptides with molecular weights of 
about 28 kD have been described in several investiga- 
tions. Roby and Gibson (Roby, C. and Gibson, W. (1986) J. 
Virol. 59, 714-727) and Nowak et al . (Nowak, B. et al . 

15 (1984) Virology 132, 325-338) describe a phosphoprotein 
of 24 kD and 29 kD, respectively. It is suggested in both 
publications that this protein is localized in the 
matrix. Pereira et al . (Pereira, L. et al . (1984) 
Virology 139, 73-86) describe a monoclonal antibody which 

20 precipitates from infected cell extracts a 25 kD 
glycoprotein which belongs to the glycoprotein D complex. 
Irmiere and Gibson (Irmiere, A. and Gibson, W. (1985) J. 
Virol. 56, 277-283) have identified a 28 kD protein which 
was found both in the A and in the B capsid of various 

25 HCMV strains. Re et al . (Re, M.C. et al . (1985) J. Gen. 
Virol. 66, 2507-2511) investigated a 28 kD structural 
protein msing a monoclonal antibody P2G11 (MAb P2G11) . It 
remains unclear whether this was the protein described by 
Pereira et al . (loc. cit.) or that described by Nowak et 

30 al . (loc . cit . ) . 

Since a structural protein of 28 kD is recognized by 
almost all highly positive human sera, and thus the 28 kD 
proteins must include one of the principal immunogens of 
HCMV, it appears desirable to identify and to isolate the 
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HCMV gene coding for it. Another aim was subsequently to 
express this gene in suitable host systems in order to 
characterize it more accurately and, where appropriate, 
to establish it as another principal immunogen of HCMV. 

5 It has been found that it is possible with the MAb P2G11 
(Re et al . loc. cit . ) to identify and isolate from an 
HCMV cDNA gene bank clones which code for a 2 8 kD 
phosphoprotein (pp2 8) . To date no phosphoprotein 2 8 kD in 
size has been disclosed. 

10 To prepare the gene bank, human prepuce fibroblast cells 
were infected with HCMV, strain Ad 169, and, 96 to 120 
hours after the infection, the poly(A) + -RNA was isolated, 
converted into ds-DNA and, without size fractionation, 
inserted into the commercially available phage expression 

15 vector Xgtll. For this, the vector was cleaved with EcoRI 
and treated with alkaline phosphatase (from calf intes- 
tine) in order to suppress intramolecular religation. The 
cDNA was, by attachment of EcoRI linkers, inserted 
between the phage arms and packaged in vitro. In this 

20 way, 100 ng of ds-cDNA resulted in a gene bank which 
contained about 5 x 10 5 independent recombinants and 18% 
wild-type phages. 

The screening of the gene bank was carried out by the 
method of R.A. Young and R.W. Davis, Proc . Natl. Acad. 

25 Sci. USA 80 (1983), 1194-1198, but with the modification 
that horseradish peroxidase was coupled to protein A, and 
4 -chloro-l-naphthol was used as detection system, employ- 
ing the monoclonal antibody P2G11 described above. In 
this immunoscreening the colonies which are present on 

30 nitrocellulose filters are cautiously lysed, incubated 
with above -described monoclonal antibodies and, after 
removal of unbound reactants, positive plaques are 
detected using the said modified detection system. 

On screening of the gene bank with MAb P2G11, two posi- 
35 tive signals were obtained from 150,000 recombinant 
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lambdagtll phages. One clone with an insertion of about 
270 basepairs (bp) was selected and purified for further 
characterization; it was called BUML-1. 

The E.coli strain Y 1089 was infected with the recombi- 
5 nant phage, and the synthesis of the /3-galactosidase 
fusion protein was induced by addition of isopropylthio- 
galactoside (IPTG) . This resulted in the formation of a 
fusion protein of about 130 kD, which is distinctly 
larger than the /3-galactosidase (118 kD) and is not found 

10 in E. coli cells infected with lambda gtll; nor is it 
present in cells infected with BUML-1 but not induced. In 
Western blot analyses only the 130 kD polypeptide reacted 
with MAb P2G11. Hence it is evident that the recombinant 
clone BUML-1 synthesizes a fusion protein containing a 

15 HCMV protein portion. 

The cDNA insertion of about 270 bp was now used to locate 
the gene for the HCMV protein in the viral genome : for 
this purpose, the abovementioned cDNA insertion was 
hybridized with 8 cosmid clones which cover the entire 

20 genome of HCMV (B. Fleckenstein et al . (1982) Gene 18, 
39-46) . The cosmid pCM 1058, which contains the Hind III 
fragments P, R and S, hybridized with the cDNA. More 
detailed Southern blot analysis of this region localized 
the HCMV DNA fragment to a 50 0 bp KpnI/Smal fragment on 

25 the left-hand end of the Hind III R fragment (Fig. 1) . It 
was possible, using an Sstll cleavage site on the 
nucleotide 1877, to assign the cDNA to the right-hand Kpn 
I/Sma I fragment in the genome orientation as shown in 
Fig. 1. 

3 0 The cDNA of the clone BUML-1 was sequenced (Sanger 
method). The DNA sequence is underlined in Table 1. 
Comparison with the viral DNA sequence in this genomic 
region made it possible to assign unambiguously to a long 
open reading frame (ORF) which extends from nucleotide 

35 1400 to 1968 (Tab. 1) . The molecular weight calculated 
from the amino acid sequence corresponding to this ORF is 



20933 d, which comprises a difference of about 7 kd from 
the values found. This probably derives from the fact 
that this protein is extremely hydrophilic and is more- 
over phosphorylated (see below) . Computer analysis by the 
5 method of Hopp and Woods (Hopp. P.P. and Woods, K.R. 
(1981) Proc. Natl. Acad. Sci . U.S. A 78, 3823-3828) shows 
that the most hydrophilic regions are in the area of 
amino acids (AA) 50-60 and 110-120. It has been found 
that MAb P2G11 recognizes an epitope encoded by the cDNA 
10 of AA 7 to 95. 

In Northern blot analyses the cDNA fragment of BUML-1 
hybridized most strongly with a late mRNA which is 1.3 kb 
in size and is completely transcribed from the direction 
of the Hind III R fragment. 

15 10 of 14 HCMV-positive sera selected at random reacted 
with p 28 derived from purified viruses; the same sera 
likewise reacted with a fusion protein (p 271, see 
Example 1) synthesized by a manipulated gene. When HCMV 
particles were phosphorylated in vitro (phosphorylated in 

20 analogy to Roley, C. and Gibson, W. loc . cit . ) it was 
possible to precipitate a phosphorylated p 28 both with 
MAb P2G11 and with antibodies against the fusion protein 
p 271 (see Example 1) . This indicates that the cloned 
protein is phosphorylated and thus may be called pp 28. 

25 Since it would be possible to isolate pp 28 in the quan- 
tities necessary for diagnostic aids and vaccines only 
with great technical elaboration, the mode of preparation 
by genetic manipulation according to the invention is 
particularly advantageous. It has emerged that not only 

30 products expressed by eukaryotic cells but also ex- 
pression products of bacteria have antigenic activity. 
Since bacteria do not produce phosphoproteins from 
foreign genes, it was not to be expected that "HCMV pp 
28", or parts thereof, prepared in bacteria would also 

3 5 have strong immunogenic activity. However, it has emerged 
that even such proteins are just as unambiguously recog- 



nized by appropriate sera as is authentic pp 28. 
Consequently, the invention relates to 

a) the purified and isolated DNA sequence according to 
Table 1 including its transcription products, 

b) DNA structures and vectors containing this sequence 
in whole or in part , 

c) pro- or eukaryotic cells transformed with such DNA, 

d) the polypeptides, or parts thereof, expressed by 
these cells by reason of the transformation, 

e) the amino acid sequences thereof and the use thereof 
as a diagnostic aid, 

f ) antibodies against the polypeptides under (d) inclu- 
ding their use for passive immunization, for diag- 
nosis and for purifying said polypeptides, 

g) vaccines against HCMV, which contain peptides and 
amino acid sequences from (e) alone or in combina- 
tion, 

h) and a method for the preparation, by genetic manipu- 
lation, of the polypeptides, or parts thereof, 
mentioned in section (d) . 

Further embodiments of the invention are given in the 
examples which follow, the table and the claims. 

Example 1: Construction and expression of the plasmid 
p271 

Firstly, the plasmid pHM 7 was produced by inserting the 
approximately 500 bp KpnI-Smal fragment (nucleotides 
1443-1936 from Tab. 1) into M13mpll. The plasmid p 271 is 
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obtained by insertion of the approximately 500 bp EcoRI - 
Sma I fragment of pHM 7 into pEX-2 (Stanley, K. and P. 
Luzio (1984) EMBO Journal 3, 1429-1434) . The plasmid p271 
thus codes for a fusion protein of about 133 kD, composed 
5 of a pp 28 portion (about 18 kD) fused to a Cro//3-galac- 
tosidase hybrid protein (about 115 kD) . Expression in 
suitable E.coli strains is induced by heat -inactivat ion 
of a temperature-sensitive repressor. E.coli pop 2136 
(Stanley, K. and P. Luzio loc . cit . ) was cultured to a 

10 density of 0.2-0.3 (A 600nm ) at 30°C, and the synthesis of 
the fusion protein was induced by a rapid change in 
temperature to 42°C. After 90 min at 42°C, the cells were 
harvested, and the pp 2 8 protein was purified by known 
methods. The fusion protein contributes about 5% of the 

15 total protein mass. 

Example 2 : Optimization of pp 28 expression 

By the reclonings described hereinafter it was possible 
(1) to improve overall the expression of pp 28 as a 
fusion protein and (2) to reduce the foreign portion in 

2 0 the fusion protein. The starting plasmid chosen was 

pBD2IC20H (proposed in German Patent Application 
P 37 27 137.7) . This plasmid thus codes for a j3-glactosi- 
dase portion which is considerably (by more than 6 0%) 
shorter than with pEX-2, and induction was effected via 
25 the Lac promoter system by addition of isopropylthio- 
galactoside (IPTG) . 

Two strategies were chosen for the cloning of the pp2 8 
DNA fragment from p271: 

1) p271 was cut with EcoRI and Smal, and the EcoRI 
30 protrusions were filled in using the Klenow frag- 

ment. The resulting approximately 500 bp fragment 
was inserted into the Smal site of pBD2IC20H. The 
linker region of the resulting plasmid pGBlO has the 
following DNA sequence (verified by indirect sequen- 

3 5 cing on the double strand) : 
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(S) E (filled in) S 
(m) c m 
(a) o a 
(I) R I 
5 I 

GATGGGGATCCCCAATTCGAGCTCGCCCGACC . . . CCCGGG 

+ + ca. 500bp 

CTACCCCTAGGGGTTAAGCTCGAGCGGGCATGG : : : GGGCCC 
from pBD2IC20H>< from p 271 >< pp28. . . > 
10 AspGlyAspProGlnPheGluLeuAlaArgThr . . . ProGly 

2) The reading frame in the linker region of pBD2IC20H 
was shifted by filling in the Bam HI site (--> 
plasmid pGBll) . It was then possible for the 
EcoRl/Smal fragment from p2 71 to be inserted, 
15 without previous filling- in of the EcoRI site, 

directly into pGBll which had been cut with EcoRI 
and Nrul . The linker region of the resulting plasmid 
pGB12 has the following DNA sequence: 

E (S N) 

20 c (m r) 

o (a u) 

R (I I) 

I 

GATGGGGATCGATCCCCGGGTACCGAGCTCGAATTCGAGCTCGCCCGTACC . . . CCCCGA 

25 + + + + ca. 500bp 

CTACCCCTAGCTAGGGGCCCATGGCTCGAGCTTAAGCTCGAGCGGGCATGG . . . GGGGCT 

from pGBll >< from p271 >< pp28...> 

AspGlyAspArgSerProGlyThrGluLeuGluPheGluLeuAlaArgThr . . . ProArg 

Estimation of the color intensity of the relevant protein 
30 bands after fractionation of E. coli total extracts 
revealed that the p271-encoded protein, after its 
induction, made up about 5% of the total protein content, 
whereas the corresponding figures for pGBlO and pGB12 
were throughout about 20%. If account is taken of the 
3 5 fact that the foreign protein content in the pGBlO- and 
pGB12 -encoded fusion proteins is less than in that 
encoded by p271, it is evident that pp28 expression is 
increased about ten- fold by use of pGBlO or pGB12 . 



Key to Tab. 1 
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The open reading frame coding for pp 2 8 starts at 
nucleotide 1400 and ends at nucleotide 1968. The region 
of the cDNA of BUML-1 is indicated by a full line under 
5 the relevant nucleotides (nucleotide 1416 to 1683) . The 
depicted sequence starts (nucleotide 801) with the Hind 
III cleavage site of the S and R fragments. A protein 
sequence with partly overlapping reading frame from 
nucleotide 801 to 1460 is also indicated. 

10 Key to Fig. 1 

Upper part: physical genome map of HCMV for the restric- 
tion endonucleases Hind III and EcoRI . 

Lower part: restriction map for the Hind III R fragment. 
The shaded area shows the region of the cDNA of the clone 
15 BUML-1. 



Table 1 



- 9 - 



8 



8 S 



8 8 



or* 



M * 
W I 

° < 

O I 
O 1 

o i o 

U I 

< I ^ 

O i Q 
O I 
O t 

< •»(/) 

U I 

u t 

O I o 

u t 

* I 

C I o 

t- -4- 

O I 

< I to 
O I 

r~ l 

U* I ' 

< » _ 

C I 

< * 

< I ^ 

U I 
U I 
O l < 

CJ I 



< I — 

C I 
I 

cr i > 

tr i u_r 

c i 

u I 

t- I to 



C I < 



It 



< •+ 


o ♦ 




O I o 


< 1 


u 


O 1 


U 1 O 




< 1 


t- 1 


o 


O 1 UJ 


1 


o 


w ■ 


>- 1 u_ 




*- 1 


CJ 1 




N» 1 U. 


< 1 




1 


1 >- 


< 


U 1 


t- 1 




<J ♦ a. 


< ■+ 




< 1 


*- i >- 




1 


O 1 


o 


< 1 — 


< 1 


U 


O 1 


U 1 O 


U 


<J 1 


(_J i 


< 


CJ 1 c 


4 t 


»- 


O t 


O 1 3! 






1 






O I 


o 


D ' 


o ♦ cr 






O 1 


(J 












< 






o 




<f 1 




^ 1 


5 ! z 






i 
















O 4- 


>— •+ 




C IO 


1 




C 1 


»- 1 u. 


< 


(J 1 


>- 1 


o 


U t Q. 


CJ 1 


(J - 


c; i 


o » < 




O 1 


O 1 


< 


< i m 


O 1 


o 


Li 1 


u i a. 


o 


C 1 


O 1 




c * o 


♦ 


o - 


C t 


V 1 _J 


< 


O t 


< 1 


o 


U 1 cr 


U 1 


o 


C 1 


t- 1 CO 


V 


p- 1 


1 


u 


<J 1 _J 


t- 1 


(J 


U 1 


t- 1 u, 


< 


< 1 


c-* i 


c 


U 1 X 


O 1 


o 


u ♦ 


O ♦ C£ 


L-> - 


< 1 


a i 


u 


<_ 1 ~ 


i 




1 


a i < 


< 




< i 




cr i o 


i- i 




— 1 


O I > 




cr t 


O t 




C i < 


< 1 




U> 1 


tp r lu 


< 


c * 




< - 


c » cr 


< i 


< 


C* 1 


»- i >- 




C 1 


13 I 


< 


C 1 o 


*- 1 


1 


CJ 1 


a i > 


< 1 



5 1 u 
I z < 

*~ * 5 



w i t; t i 

c * o * 

U I- < • 

•-I U I 

a : J 5 : ; 

ci < i 

< i to £ i 

O I Oil 



O I > — I 



•- I 

< I — 

U I 

— I 



< I - 



< ♦ — 
u i r: 

U I 

I- I 

| 

O I > 



si- 



I 2£ 



U I 

O I 

O + C£ 

U I 

U I 

I t/> 

O I 

| 

W I 

O I o 

o ■♦• 

O I 

>- I 

a r 

< i 
o I 

O 1 

t- I 

*- I 
o 

<_> I 

U I 

< I 
O I 

< I 
*- I 



to 



8 



U 1 _J 


U 1 




O I 


< » 




>- 1 


^- 1 




»- 1 _J 


U 1 




O 1 


*- 1 


uo 


< 1 


U I 




O 1 UJ 


•- 1 




U 1 


O 1 


> 


o * 


* 




t- 1 


U 1 




U 1 


O I 


< 


O I 


p- 1 




O l o 


< 1 




O 1 


U I 






U 1 




U 1 — 1 


(7 1 




§ ! 


U 1 
O r 


cr 


O ♦ UJ 


<_> * 




U I 


< I 




o 1 


»- i 




< 1 LO 


t- I 




1 ! 


I 


u. 




C i 




O 1 UJ 


< 1 




O 1 


U 1 


o 


< 1 






a i w 


U 1 




<-> ♦ 




O l 


Ul 1 




1 cc 


< 1 




O 1 


O 1 


o 


< i 


1 




a i uj 






U 1 


♦- 1 


u. 


a i 


(J I 




U 1 cc 


1 




U 1 


IZ 1 


> 




c ♦ 




>~ 1 U- 


f- t 




U 1 


c: i 


> 




U 1 




< t — 


U* 1 




W 1 


U 1 


a. 


u t 


O 1 




O i < 


KJ 1 




17 1 


< 1 




O 1 


O t 










o 


o 

















•- I 

u t 



— I 

O I 

— I 

O I 
O I 

< I 

u t 
K> ♦ 

o t 

V I 

— I 

O I 
O I 
O I 

t- I 

U I 

I 

f 

O ! 
I 

< I 
O I 

" I 
I 



O I > 
O r t 

(J I c 



§: 



§ 

o 

U I O 

$ : 

O I 

a i 
u i d 
a i 



I UJ 



< 
o 

O I 

< I 

O I UJ 



C I > 
— I V 

< I 

- >- 



< I 

C I UJ 

c I 

c: i 

5 : 

C I UJ 



o + o 


»- ♦ 


o * 


< + 


>- * 


u * 


O 1 


U t _J 


u t 


CD 1 


O 1 


»~ 1 


< 1 


U 1 


O 1 Q. 


CJ 1 


p~ 1 


o t 


O 1 UJ 


< 1 


H- | 


< 1 


U 1 




KJ 1 


O 1 o 


O 1 




O 1 


< 1 


O 1 


U 1 


1 1 


5 i 




»- 1 


v i e 


< 1 


e i 


U 1 


O 1 




»- t 


O 1 o 


O 1 


a i 




H- | 


>— t 


O t 


< 1 cr 


V 1 


i \ 




^- 1 u. 


LJ 1 


U 1 






1— t 


o * 


< + 1— 


o ♦ 


O 1- 


»- 


p- ♦ 


<_> 1 


O I 


U I C. 


i 


CJ f 


U 1 


< 1 »— 


< 1 


< 1 


O 1 


1 


f 1 


O f 


O 1 UJ 


CJ 1 


a i 


a i 


U 1 


u t 


a i 


< 1 


< i 


i 


»- 1 


i- 1 CO 


< t 


O 1 


LJ 1 


O 1 


O 1 


U 1 


<J 1 o 




1- 1 


>- 1 


— 1 


O 1 


o t 


O 1 o 


*- 1 


O 1 


O 1 


u i cr 


»- 1 


U 1 


1 


U 1 


CJ 1 


O 1 


< 1 2Z 


U 1 


U 1 


CJ 1 


O 1 


— ^ 




CJ ♦ Cv 




CJ 


♦ 


O I > 


K 1 


O 1 




U 1 




a i 


< I — 


O 1 




U 1 


1 


w i _ 


V 1 


(j i cr 




O I 


o t 


O 1 < 


U 1 


O 1 


< 1 


U 1 


O 1 


C» f 


»~ 1 CO 


U 1 


CJ 1 


O 1 


CJ 1 




CJ 1 


(j i a. 


♦- 1 


*- 1 


< 1 


f J 2 


O 1 


O 1 


u t 


H- | 


(J 1 




< 1 CO 


*- i 

U I _J 


s : 


OT 


cc 




< + 


< + 


►— 


1- + 


< ♦ 


O 1 


o i O 


O 1 


i 


O 1 


O 1 




O 1 


o i cr 


t 




CJ 1 


5 }-* 

(J 1 


< 1 


o t 


f- 1 


O 1 


CJ 1 


u I O 




U 1 


1- 1 


U 1 


U 1 


1 




CJ 1 


f 1 


1— 1 


t- 1 LO 


< 1 




u i a. 


O 1 


CJ 1 


C> 1 


U 1 * 


U 1 


a i 


I 


O 1 


O 1 _ 


U 1 




t- i 


V- 1 


h- .| 


U 1 O 


< J 




i- i 


)— 1 


O 1 




v + ZZ 




o * 


H* ■+ 






CJ 1 


o T > 


CJ t 


H- 1 


< 1 


3 1 o 


< 1 


O 1 


1 CO 


t- 1 


1 


U 1 


U 1 ~ 


»- 1 


U 1 


1 


O 1 



J I < 



< I 



u 



< i 
*~ i 

< i 
*- i 

O I 
I 

O 1 

•- I 

U I 



CJ 

- I CO 

O I 



CJ I c_ 

< I 



c 
< 

5 



5:^ 

< i 

< I *c 

5 ! 

cj t O 
o i 
o • 
w i cr 



C I 

O I 

»~ I 

cr t 

u t 

c; i 

CJ I 



o t 



O I 

C I 
■» 

— I 

C I 

< I 

CT I 

C I 

C7 I 

U I 



5i 



o I 

< i 

cr i 

§ : 



8 



o 



Claims 



- 10 - 



HOE 88/B 002 



- Ma 670 



1. A structural phosphoprotein having a molecular 
weight of about 28 kd (pp 28) from human cytomegalo- 
virus (HCMV) or immunogenic parts thereof, obtain- 

5 able by expression of the gene which is located in 

the region of the fragment Hind III R of the genome 
of HCMV, strain Ad 169, or parts of this gene. 

2. pp 28 and immunogenic parts thereof, obtained by 
expression of the gene which is located on a 1.0 kb 

10 Smal fragment within the Hind III R fragment from 

the genome of HCMV, strain Ad 169, or parts of this 
gene . 

3. pp 28 or parts thereof, obtained by expression of 
the gene corresponding to Table I, nucleotide 1400 

15 to 1968. 

4. DNA sequence 1400-1968 according to Table I, coding 
for pp 28, and alleles and derivatives. 

5 A DNA structure or vector which comprises the pp 28- 
encoding gene or parts thereof as claimed in claim 

2 0 1, 2, 3 or 4. 

6 A prokaryotic or eukaryotic cell transformed with a 
DNA structure or vector as claimed in claim 5. 

7. A method for the preparation of pp 28 or immunogenic 
parts thereof, which comprises bringing about the 

25 expression, in whole or in part, of the gene coding 

for pp 28 as claimed in claim 1. 

8. The method as claimed in claim 7, wherein the 1 . 0 kb 
Smal fragment from the Hind III R fragment is 
employed . 



30 9 . 



The method as claimed in claim 7, wherein the gene 



corresponding to Table I, nucleotide 1400-1936, is 
employed . 

A diagnostic aid which contains proteins or parts 
thereof as claimed in claim 1 to 3 . 

A diagnostic aid which contains poly- or monoclonal 
antibodies against proteins as claimed in claim 1 to 
3 . 

A diagnostic aid which contains DNA sequences or 
parts thereof as claimed in claim 4 or sequences 
hybridizing thereon . 

A vaccine which contains proteins or parts thereof 
as claimed in claim 1, 2 or 3. 

A vaccine which contains antibodies against proteins 
as claimed in claim 1, 2 or 3. 
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Figure 1 
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BEHRINGWERKE- AKTIENGESELLSCHAFT HOE 88/B 002 - Ma 670 Dr. LP/sch 
Beschreibung 

StruJcturelles PIiosph.oprotein (pp 28) des mensciiliciLeii 
Cytomegalovirus (HCMV) , seine Herstellung und Verwendung 



Die Erf indung betrifft ein strukturelles HCMV- Phosphoprotein 
von 28 kd (pp 28) und immunogene Teile davon, seine 
gentechnische Herstellung sowie seine Verwendung als 
Diagnostikum und zur Erzeugung von Antikorpern und 
Impf stoff en . 

In mehreren .Untersuchungen sind HCMV- Polypeptide mit 
Molekulargewichten von etwa 28 kd bisher beschrieben worden. 
Roby und Gibson (Roby, C. und Gibson, W (1986) J. Virol. 59 , 
714-727) und Nowak et al . (Nowak, B. et al . (1984) Virology 
132, 325-338) beschreiben ein Phosphoprotein von 24 kd bzw. 
29 kd. In beiden Verof f ent 1 ichungen wird vermutet, da£ 
dieses Protein in der Matrix lokalisiert ist. Pereira et al . 
(Pereira, L. et al . (1984) Virology 139, 73-86) beschreiben 
einen monoklonalen Antikorper, der aus infizierten 
Zellextrakten ein 25 kd Glykoprotein pr azipitiert , das zum 
Glykoprotein D-Komplex gehort. Irmiere und Gibson (Irmiere, A. 
und Gibson, W. (1985) J. Virol. 56, 277-283) haben ein 
28 kd Protein ident if iziert , das sowohl im A- als auch im 
B-Kapsid verschiedener HCMV- Stamme gefunden wurde . Re et al . 
(Re, M.C. et al. (1985) J. Gen. Virol. 66, 2507-2511) 
untersuchen ein 28 kd Strukturprotein mit Hilfe eines 
monoklonalen Antikorpers P2G11 (MAK P2G11) . Dabei bleibt 
of fen, ob es sich urn das von Pereira et al . (a.a.O) oder urn 
das von Nowak et al . (a.a.O.) beschr iebene Protein handelt. 

Da ein Strukturprotein von 28 kd von fast alien 
hochpositiven hum an en Seren erkannt wird, und somit unter 
den 28 kd-Proteinen eines der Haupt immunogene des HCMV zu 
finden ist, erschien es wunschenswert , das dafur kodierende 
HCMV-Gen zu identif izieren und zu isolieren. Ein weiteres 
Ziel bestand darin, dieses Gen dann in geeigneten 
Wirtsystemen zu exprimieren, urn es genauer zu 
charakter isieren und gegebenenf alls als weiteres 
Haupt immunogen von HCMV zu etablieren. 
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£s wurde gefunden, daB mit dem MAK P2G11 (Re et al . a.a.O.) 
aus einer HCMV-cDNA Genbank Klone identif iziert und isoliert 
werden konnen, die fur ein 28 kd Phosphoprotein (pp 28) 
kodieren. Bisher war ein 28 kd grofies Phosphoprotein nicht 
bekannt . 

Zur Herstellung der Genbank wurde aus mit HCMV, Stamm Ad 169 , 
inf izierten menschl ichen Vorhaut- Fibroblastenzellen 96 bis 
120 Stunden nach der Infektion die poly(A) + -RNA isoliert, in 
ds-DNA uberfuhrt und ohne Groflenfraktionierung in den 
handelsiiblichen Phagen- Expressionsvektor Xgtll eingefiigt . 
Hierzu wurde der Vektor mit EcoRI gespalten und mit 
alkalischer Phosphatase (aus Kalberdarm) behandelt, urn die 
intramolekulare Religation zu unterdrucken. Durch Anfiigen 
von EcoRI- Linkern wurde die cDNA zwischen die Phagenarme 
eingefiigt und in vitro verpackt. Aus^lOO ng ds-cDNA wurde so 
eine Genbank erhalten, die etwa 5*10 unabhangige 
Rekombinanten und 18 % Wildtyp- Phagen enthielt. 

Das "Screening" der Genbank erfolgte nach der Methode von 
R.A. Young und R.W. Davis, Proc . Natl. Acad. Sci. USA 80 
(1983) 1194-1198, j edoch mit der Abwandlung, da£ Meerrettich- 
Peroxidase an Protein A gekoppelt wurde und 4-Chlor-l- 
naphthol als Detekt ionssystem diente, unter Einsatz des 
vorstehend beschr iebenen monoklonalen Antikorpers P2G11. 
Bei diesem "Immunoscreening" werden die auf ; 
Nitrozellulosef iltern vorhandenen Kolonien vorsichtig 
lysiert, mit oben beschr iebenen monoklonalen Antikorpern 
inkubiert und nach Entfernen ungebundener Reaktanden 
positive Plaques mit dem genannten modif izierten 
Detekt ionssystem nachgewiesen . 

Beim "Screening" der Genbank mit MAK P2G11 wurden von 
150000 rekombinanten Lambda gtll Phagen zwei positive 
Signale erhalten. Ein Klon mit einer Insertion von etwa 270 
Basenpaaren (bp) wurde fur dieweitere Charakterisierung 
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ausgewahlt unci gereinigt; er erhielt die Bezeichnung 
BUML- 1 . 

Der E.coli Stamm Y 1089 wurde mit dem rekombinierten Phagen 
infiziert und die Synthese des fi-Galactosidase- 
fusionsproteins durch Zugabe von Isopropylthiogalaktosid 
(IPTG) induziert. Hierbei wurde ein Fusionsprotein von etwa 
130 kd gebildet, das deutlich groBer als die B- Galactosidase 
(118 kd) ist und das nicht in E . coli- Zellen gefunden wird, 
die mit Lambda gtll inf iziert sind; es ist auch nicht in 
mit BUML-1 infizierten, aber nicht induzierten Zellen 
vorhanden. In "Western Blot" Analysen reagierte nur das 
130 kd Polypeptid mit MAK P2G11. Es ergibt sich somit, daB 
der rekombinierte Klon BUML-1 ein Fusionsprotein mit einem 
HCMV- Protein- Anteil synthetisiert . 

Die cDNA- Insertion von etwa 270 bp wurde nun verwendet, urn 
das Gen fur das HCMV- Protein im Virus- Genom zu lokalisieren: 
Hierfur wurde die o.g. cDNA- Insertion mit 8 Cosmid Klonen 
hybridisiert , die das gesamte Genom von HCMV umspannen 
(B. Fleckenstein et al . (1982) Gene 18,, 39-46). Das Cosmid 
pCM 1058, das die Hind I I I- Fr agmente P, R und S enthalt, 
hybridisierte mit der cDNA . Eine eingehendere "Southern Blot 
Analyse dieser Region begrenzte das HCMV- DNA- Fragment auf 
ein 500 bp Kpn I/Sma I- Fragment am linken Ende des Hind 
II I- R- Fragments (Fig. 1). Mittels einer Sst 1 1- Spaltstelle 
am Nukleotid 1877 war es moglich, die cDNA dem rechten 
Kpn I/Sma I Fragment in der Genomor ientierung wie in Fig. 1 
gezeigt zuzuordnen . 

Die cDNA des Klons BUML-1 wurde sequenziert (Methode von 
Sanger) . Die DNA-Sequenz ist in der Tabelle 1 unterstrichen. 
Durch Vergleich mit der viralen DNA-Sequenz in diesem 
genomischen Bereich konnte eine eindeutige Zuordnung zu 
einem langen offenen Leserahmen (ORF) getroffen werden, der 



von Nukleotid 1400 bis 1968 reicht (Tab. 1). Das aus der zu 
diesem ORF korrespondierenden Aminosauresequenz berechnete 
Molekulargewicht betragt 20933 d, was einen Unterschied von 
etwa 7 kd zu den gefundenen Werten beinhaltet. Das beruht 
wahrscheinlich darauf , daB dieses Protein extrem hydrophil 
und ferner phosphoryliert (s.u.) ist. pie Computer- Analyse 
nach Hopp und Woods (Hopp, P.P. und Woods, K.R. (1981) Proc . 
Natl. Acad. Sci. U.S.A. 78, 3823-3828) zeigt, daB die 
hydrophilsten Regionen im Bereich der Aminosauren (AS) 50-60 
und 110-120 liegen. Es wurde gefunden, daB MAK P2G11 ein 
Epitop erkennt, das durch die cDNA von der AS 7 bis 95 
kodiert wird. 

In "Northern Blot Analysen hybridisierte das cDN A- Fragment 
von BUML-1 am starksten zu einer 1,3 kb groBen spaten 
mRNA, die vollstandig vom Hind III R- Fragment her 
transkribiert wird. 

10 von 14 zufallig gewahlten HCMV-positiven Seren reagierten 
mit p 28, das aus gereinigten Viren' stammte; dieselben" 
Seren reagierten ebenfalls mit einem Fus ionsprotein (p 271, 
siehe Beispiel 1) aus gentechnischer Synthese. Bei in vitro 
phosphorylierten HCMV- Part ikeln (phosphoryliert analog zu 
Roley, C. und Gibson, W. a.a.O.) konnte ein phosphoryliertes 
p 28 sowohl mit MAK P2G11 als auch mit Antikorpern gegen 
das Fusionsprotein p 271 (siehe Beispiel 1) prazipitiert 
werden. Das spricht dafur, daB das klonierte Protein 
phosphoryliert ist und somit als pp 28 bezeichnet werden 
kann. 

Da pp 28 in den Mengen, die fur Diagnostika und Vaccinen 
erforderlich sind, nur unter groBem technischen Aufwand 
zu isolieren ware, ist die erf indungsgemaBe gentechnische 
Herstellungsweise besonders vorteilhaft. Es zeigte sich, daB 
nicht nur von eukaryotischen Zellen exprimierten Produkte 
antigen wirken, sondern auch Express ionsprodukte von 
Bakterien. Da Bakterien von Fremdgenen keine Phosphoproteine 



erzeugen, war nicht zu erwarten, daB auch bakteriell 
hergestelltes "HCMV-pp 28" oder Teile davon stark immunogen 
w irken. Es zeigte sich jedoch, daB auch solche Proteine von 
entsprechenden Seren ebenso eindeutig erkannt werden wie 
authentisches pp 28. 

Erfindungsgegenstand sind folglich 

a) die gereinigte und isolierte DNA-Seguenz gemaB Tabelle 1 
einschlieBlich ihrer Tr anskr ipt ionspr odukt e 

b) diese Sequenz ganz oder teilweise enthaltende 
DNA-Strukturen und Vektoren 

c) mit solcher DNA transf ormierte pro- oder eukaryotische 
Zellen, 

d) die von diesen Zellen aufgrund der Transformation 
experimierten Polypeptide oder Teile davon, 

e) der en Aminosauresequenzen sowie deren Verwendung als 
D i agno s t ikum 

f ) Antikorper gegen die Polypeptide unter (d) einschlieBlich 
ihrer Anwendung zur passiven Immunisierung , zur Diagnostik 
und zur Reinigung besagter Polypeptide 

g) Impfstoffe gegen HCMV, die Peptide und Aminosauresequenzen 
von (e) alleine oder in Kombination enthalten, 

h) sowie ein Verfahren zur gentechnischen Herstellung der 
unter (d) angefiihrten Polypeptide oder Teilen davon. 



Weitere Ausgestaltungen der Erfindung sind in den 
nachf olgenden Beispielen, der Tabelle und den 
Patentanspriichen auf gef uhrt . 



• til 
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Beispiel 1: Konstruktion und Expression des Plasmids p 271 

Zunachst wurde das Plasmid pHM 7 erzeugt durch Einbau des 
ca. 500 bp KpnI-Smal Fragments (Nukleotide 1443 - 1936 von 
Tab. 1) in M13mpll. Man erhalt das Plasmid p 271 durch 
Insertion des ca. 500 bp EcoRI-Sma I-Fragments von pHM 7 in 
pEX-2 (Stanley, K. und P. Luzio (1984) EMBO Journal 3, 1429 * 
- 1434) . Das Plasmid p 271 kodiert also fur ein 
Fusionsprotein von etwa 133 kd, bestehend aus einem pp 28 
Anteil (ca. 18 kd) fusioniert mit einem Cro/fi- Galaktosidase- 
Hybridprotein (ca. 115 kd) . Die Induktion der Expression in 
geeigneten E. coli-Stammen erfolgt durch Hitzeinakt ivierung 
eines temper atursens it iven Repressors. E. coli pop 2136 
(Stanley, K. und P. Luzio a.a.o.) wurde zu einer Dichte von 
0,2-0,3 (A 600nm ) bei 30°C angeziichtet und die Synthese des 
Fusionsproteins durch schnellen Temperaturwechsel auf 42 °C 
induziert. Nach 90 Min bei 42 °C wurden die Zellen geerntet 
und das pp 28 Protein nach bekannten Methoden gereinigt. Das 
Fusionsprotein betragt etwa 5 % der Gesamtproteinmasse . 

Beispiel 2: Express ionsopt imierung von pp 28 

Durch die nachstehend beschr iebenen Umklonierungen konnte 
(1) die Expression von pp 28 als Fusionsprotein insgesamt 
verbessert und (2) der Fremdanteil im Fusionsprotein 
verkleinert werden. Als Ausgangsplasmid wurde pBD2IC20H 
(vorgeschlagen in der deutschen Patentanmeldung P 37 27 137.7) 
gewahlt. Dieses Plasmid kodiert also fur einen gegenuber 
pEX-2 wesentlich (urn mehr als 60 %) verkiirzten 
B-Galaktosidase- Anteil , die Induktion erfolgte iiber das 
Lac- Promoter- System durch Zugabe von Isopropylthiogalaktosid 
( IPTG) . 

Zwei Strategien wurden zur Klonierung des pp28-DNA-Fragmentes 
aus p271 gewahlt: 

1) p271 wurde mit EcoRI und Smal geschnitten, die Eco 
Rl-Uberhange mittels Kl enow- Fragment aufgefiillt. Das 
result ierende ca. 500 bp- Fragment wurde in die Smal-Stelle 
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von pBD2IC20H eingesetzt. Die Linkerregion des erzeugten 
Plasmids pGBlO hat die foigende DNA-Sequenz (verif iziert 
durch indirektes Sequenzieren am Doppelstrang) : 



(S) E (aufge- S 

(m) c fullt) m 

(a) o a 

(I) R I 
I 



GATGGGGATCCCCAATTCGAGCTCGCCCGACC . . . CCCGGG 

+ + ca. SOObp 

CTACCCCTAGGGGTTAAGCTCGAGCGGGCATGG: : : GGGCCC 
aus pBD2IC20H>< aus p 271 >< pp28... > 
. AspGlyAspProGlnPheGluLeuAlaArgThr . . .ProGly 

2) Der Leserahmen in der Linkerregion von pBD2IC20H wurde 

durch Auffiillen der Bam Hl-Stelle verschoben (--> Plasmid 
pGBll). Danach konnte das Eco Rl/Smal- Fragment aus p271 
ohne vorheriges Auffullen der Eco Rl-Stelle direkt in das 
mit Eco RI und Nrul geschnittene pGBll eingesetzt werden. 
Die Linkerregion des result ierenden Plasmids pGB12 hat 
die foigende DNA-Sequenz: 

E (S N) 

c (m r) 

o (a u) 

R ? (II) 

I 

GATGGGGATCGATCCCCGGGTACCGAGCTCGAATTCGAGCTCGCCCGTACC . . . CCCCGA 

+ + + + ca. SOObp 

CTACCCCTAGCTAGGGGCCCATGGCTCGAGCTTAAGCTCGAGCGGGCATGG . . . GGGGCT 

aus pGBll >< aus p271 >< pp28 . . . > 

AspGlyAspArgSerProGlyThrGluLeuGluPheGluLeuAlaArgThr . . .ProArg 

Die Abschatzung der Farbeintensitat der entsprechenden 
Proteinbanden nach Auftrennung von E. coli- Gesamtextrakten 



I 



8 

ergab, daB nach Induktion des p271-kodierten Proteins dieses 
etwa 5 % des Gesamtproteingehalts ausmachte, wahrend die 
entsprechenden Werte fur pGBlO und pGB12 durchgangig bei 
etwa 20 % lagen. Wird der verringerte Fremdproteingehalt in 
den pGBlO- und pGB12-kodierten gegenuber dem p271- kodierten 
Fusionsprotein in Betracht gezogen, ergibt sich durch die 
Verwendung von pGBlO bzw. pGB12 eine etwa zehnfache 
Steigerung der pp28- Expression . 



Legende zu Tab. 1 

Der fur pp 28 kodierende offene Leserahmen beginnt bei 
Nukleotid 1400 und endet bei Nukleotid 1968. Der Bereich 
der cDNA von BUML-1 ist durch einen durchgezogenen Strich 
iiber den betreffenden Nukleotiden gekennzeichnet (Nukleo- 
tid 1416 bis 1683) . Die abgebildete Seguenz beginnt (Nu- 
kleotid 801) mit der Hind III - Spaltstelle der Fragmente 
S und R. Eine Proteinsequenz mit teilweise uberlappendem 
Leserahmen von Nukleotid 801 bis 1460 ist zusatzlich an- 
gegeben . 



Legende zu Fig. 1 

Oberer Teil: Physikalische Genomkarte von HCMV fur die 
Restriktionsendonukleasen Hind III und EcoR I. 

Unterer Teil: Res triktionskarte fur das Hind III-R-Frag- 
ment. Die schraffierte Region zeigt den Bereich der cDNA 
des Klons BUML-1. 
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P at en t an sp riich e 

1. Strukturelles Phosphoprotein mit einem Molgewicht von 
etwa 28 kd (pp 28) aus humanem Cytomegalovirus (HCMV) 
und immunogene Teile davon, erhaltlich durch Expression 
des Gens, das im Bereich des Fragments Hind III R des 
Genoms von HCMV, Stamm Ad 169, liegt, oder Teilen dieses 
Gens . 



2. pp28 und immunogene Teile davon, erhalten durch 
Expression des Gens, das auf einem 1,0 kb Smal- Fragment 
innerhalb des Hind III R- Fragments aus dem Genom von 
HCMV, Stamm AD 169, liegt oder Teilen dieses Gens. 

3. pp28 oder Teile davon, erhalten durch Expression des 
Gens entsprechend Tabelle I, Nukleotid . 1400 bis 1968. 

4. DNA-Sequenz 1400-1968 gemaB Tabelle I, kodierend fur 
pp28, sowie Allele und Derivate. 

5. DNA- Strukturen und Vektoren, die das fur pp28 kodierende 
Gen oder Teile davon nach Anspruch 1, 2, 3 oder 4 
enthalten. 

6. Prokaryotische oder eukaryotische Zellen, die mit 
DNA- Strukturen oder Vektoren nach Anspruch 5 

tr ansf ormiert s ind . 

7. Verfahren zur Herstellung von pp28 oder immunogenen 
Teilen davon, dadurch gekennzeichnet , daJ3 man das nach 
Anspruch 1 fur pp28 kodierende Gen ganz oder teilweise 
zur Expression bringt. 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daB 
man das 1,0 kb Smal- Fragment aus dem Hind III R- Fragment 
einsetzt . 
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Verfahren nach Anspruch 7, dadurch gekennzeichnet , dafi 
man das Gen entsprechend Tabeile r, Nukleotid 1400-1936, 
einsetzt. 

Diagnostika, die Proteine oder Teile davon nach 
Anspruch 1 bis 3 enthalten. 

Diagnostika, die poly- oder monoklonaie Antikorper gegen 
Proteine nach Anspruch 1 bis 3 enthalten . . 

Diagnostika, die DNA Sequenzen oder Teile davon nach 
Anspruch 4 oder dazu hybridisierende Sequenzen enthalten. 

Impfstoffe, die Proteine oder Teile davon nach Anspruch 1, 
2 oder N 3 enthalten. 

Impfstoffe, die Antikorper gegen Proteine nach Anspruch 1, 
2 oder 3 enthalten. ^ 
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